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摘要 ” 道 过 对 真 核 生物 142 个 基因 的 部 分 启动 子 序列 的 折 蛋 模型 进行 分 析 研 究 ， 结 果 表明 ， 
这 些 基因 的 TATA 框 在 折 秋 结构 模型 中 所 表现 的 蔡 环 结构 特征 有 利于 与 反 式 作用 因子 和 RNA 
聚合 酶 的 识别 及 其 相互 作用 。 


关键 词 TATA 框 ， 折 委 结 构 Bt ¢ ys 
中 图 分 类 号 Q754 


许多 编码 基因 的 准确 转录 都 依赖 TATA HE (Breathnach 等 ，1981)。 在 原核 生物 中 ， 
RNA 转录 的 起 始 过 程 是 RNA 聚合 酶 首先 与 启动 子 -35 区 域 的 识别 信号 相互 作用 ， 再 与 
-10 区域 的 Pribow (H4F RBA MI TATA E) 的 结合 位 点 相 结 合 ， 然 后 移 到 转录 起 
始 位 点 引发 RNA 的 合成 《 孙 乃 恩 等 ，1993)。 对 原核 生物 中 的 大 肠 杆菌 54 个 启动 子 的 折 
到 结构 研究 结果 表明 ， 大 上 肠 杆菌 启动 子 中 芍 Pribow 位 于 折 又 结构 的 单 链 区 与 蝶 族 区 的 结 
合 处 ， 有 利于 RNA 聚合 酶 的 识别 和 相互 作用 ( 乐 树 云 等 ，1985)。 

在 真 校生 物 中 ，RNA 转录 的 起 始 过 程 现在 还 不 很 清楚 ， 其 原因 在 于 转录 机 构 十 分 复 
杂 。 从 启动 子 结 构 方 面 看 ， 它 涉及 到 许多 启动 子 的 转录 因子 。 在 众多 的 转录 因子 中 ， 它 们 
之 间 的 关系 还 没有 明确 的 结论 。 但 对 启动 子 部 分 的 TATA 框 功能 的 研究 一 直 是 人 们 关注 
的 焦点 。 随 着 细胞 生物 学 、 分 子 生 物 学 和 基因 工程 的 研究 和 实践 的 进展 ， 已 从 理论 和 实践 
两 方面 对 真 核 生物 TATA 框 在 转录 过 程 中 的 作用 进行 了 有 意义 的 探索 。 我 们 知道 ， 
TATA 框 是 绝 大 多 数 真 核 生 物 正确 表达 所 必需 的 ， 在 没有 TATA 框 的 基因 表达 过 程 中 可 
能 存在 某 种 灰 代 机 制 ， 这 种 机 制 可 能 涉及 到 某 种 蛋白 质 因子 与 某 种 DNA. 序列 的 共同 作 
用 。 在 真 校生 物 中 ，TATA 框 的 结构 和 功能 类 似 于 原核 生物 的 Pribow， 它 决定 了 转录 起 
始点 的 选择 ， 对 转录 的 方向 ， 以 及 转录 的 效率 起 决定 作用 《Anne O'Shee-Greenfield 
等 ，1992)。TATA 框 是 RNA 聚合 醇 的 结合 位 点 ，RNA RANS TATA 框 牢固 结合 之 
后 才 开 始 转录 。 由 于 反 式 作用 因子 和 RNA 聚合 酶 具有 相对 固定 的 拓扑 结构 ， 册 此 推测 ， 
TATA 框 也 应 具有 相 适 应 的 空间 结构 特征 。 

以 往 的 研究 结果 大 多 是 以 一 维 线性 序列 或 以 DNA 双 链 为 对 象 获 得 的 。 本 文 立足 于 三 
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维 结构 ， 通 过 对 TATA 框 序列 结构 的 大 量 研究 给 出 了 在 一 维 上 不 可 能 得 到 的 信息 。 如 : 
TATA 框 位 于 折 春 结构 的 发 夹 环 、 内 环 、 单 链 与 茎 的 结合 处 、 以 及 游离 区 等 。 
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图 1 基因 的 部 分 折合 结构 
Fig. | Graph of parts of secondary structure of some genes 

(a) 基因 M60556( 能 量 ——89.6kJ/ mol) TATA 框 位 于 内 环 区 ; (b) 基因 X05339( 能 县 
=-154.1 kJ / moNTATA 杠 位 于 发 夹 环 区 ， (c) 基因 X00965( 能 量 = 一 242.0 kJ /mol}TATA Et F 
AHA, (00 基因 JO2843(fiE E — —283.0 kJ / moDTATA 抠 位 于 游离 区 ，(e) 基因 X15565(E & 
7-]84.6 kJ / mol)TATA 框 位 于 茎 区 。 

(a) Gene M60556(total energy = —89.6 kJ; mol) TATA box is in the internal loop: (b) gene 
X05339(total energy — —154.1 kJ / mol) TATA box is in the hairpins (c) gene X00965(total 
energy = 242.0 kJ / mol) TATA box is in the intersection of hairpin and stem: (d) gene J02843 
{total energy = -283.0 kJ / mol) TATA boa is in the free region; (e) gene X15565(total 
energy = —184.6kJ / mol} TATA box is in the stem. 


1 方法 


我 们 从 GenBank 核酸 数据 库 中 随机 地 挑选 了 包括 哮 此 类 、 灵 长 类 和 无 脊椎 动物 类 中 明确 
标识 含有 TATA HERS 142 个 基因 序列 。 为 保证 TATA 框 的 准确 性 和 诬 列 的 普遍 性 以 及 计算 的 
可 行 性 ， 选 取 TATA 框 上 游 50 一 60 个 碱 基 、 下 游 100—200 TRE, BRP MX 230 的 基因 
序列 。 然 后 在 微机 上 用 Zuker 的 二 级 结构 软件 PCFOLD HHP FART, H 
Thompson 的 MOLECULE.COM 程序 画 出 二 级 结构 图 。 能 量 计算 用 Turner 等 (1987) 提 出 的 
能 量 模型 《温度 为 37C )。 这 些 折 释 结构 是 所 讨论 序列 的 具有 全 局 最 小 生成 自由 能 的 折 登 结构 
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(Zuker，1981，1989，1991)。 其 生成 自由 能 的 来 源 主 要 有 两 方面 :一 是 来 源 于 结构 中 时 旋 区 
域 的 氮 键 能 和 碱 基 间 的 堆积 能 ， 二 是 来 源 于 成 环 区 域内 发 来 环 、 膨 胀 环 等 结构 的 生成 自由 


E. 图 1(a) 一 (d) 即 是 用 此 方法 得 到 的 4 个 TATA HEB TEES RS. 


2 结果 和 讨论 


2.1 TATA 框 在 一 维 序列 上 的 保守 性 
真 核 生 物 的 TATA 框 的 一 致 序列 为 
TATAACT)AA(T) Cfh75.8., 1993). JA Ax 
文 对 142 个 基因 的 TATA 框 进行 序列 比较 
可 知 ，TATA 框 在 一 维 序列 上 具有 比较 好 
的 保守 性 。 它 的 第 一 位 和 第 四 位 残 基 T 和 
A 是 强 保 守 的 ， 出 现 的 频率 为 80965 第 二 
位 残 基 A 出 现 的 频率 为 78%， 第 三 位 残 基 
TT 出 现 的 频率 为 73%， 第 五 位 残 基 A HB 
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B Pribow 
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游离 区 


RKE 内 环 区 


A? 大 上 肠 杆 菌 与 真 核 生物 的 单 链 区 频率 比较 
Fig.2 Comparison of the frequency of 
hairpin loop, internal loop and free 


的 频率 为 67%。 
22 折 生 结构 预测 模型 

我 们 分 析 了 TATA 框 在 其 折 释 结构 模 
型 中 的 结构 特征 ， 这 些 特征 概括 在 表 1 中 。 由 表 1 可 知 ， 除 了 X15566 的 2 个 TATA 框 
位 于 东区 (但 这 2 个 TATA 框 在 折 登 结构 中 具有 特殊 的 结构 ， 它 们 在 茎 区 是 互相 匹配 的 
(图 1(e))， 这 相对 于 总 数 为 142 个 基因 而 言 ， 可 看 作 例 外 )， 其 余 基因 序列 的 TATA 框 都 
位 于 折 秋 结构 的 发 天 突 环 、 内 环 或 单 链 与 螺旋 区 的 结合 处 。68% 的 TATA 框 位 于 单 链 区 
域 ， 其 中 47% 位 于 发 天 环 的 环 区 ，19% 位 于 内 环 区 ，34% 位 于 游离 区 ; 30% 的 TATA 框 
位 于 单 链 区 与 螺旋 区 的 结合 处 ， 其 中 50% 位 于 内 环 与 螺旋 区 的 结合 处 ，50% 位 于 发 夹 环 
与 螺旋 区 结合 处 。 

23 与 大 肠 杆 菌 启 动 子 Pribow 比较 

表 1 结果 与 大 肠 杆 菌 54 个 启动 子 的 PRI 框 的 特征 是 一 致 的 ， 都 是 茎 环 结构 ， 但 是 频 
率 分 布 上 存在 差异 (图 2)。 大 肠 杆 菌 54 个 启动 子 的 PRI 框 中 出 现在 单 链 苞 的 频率 为 
46%( 其 中 64% 为 发 夹 环 区 ，12% 为 内 环 区 ，24% 为 游离 区 )， 出 现在 单 链 区 与 曲 旋 区 结合 
处 的 频率 为 54%。 由 此 可 见 ， 与 大 肠 杆菌 相 比 ， 真 核 生 物 位 于 单 链 区 的 频率 大 于 大 肠 杆 
菌 ， 在 单 链 区 中 大 肠 杆菌 位 于 发 夹 环 区 的 频率 大 于 真 核 生物 ， 且 二 者 在 单 链 内 环 区 的 频率 
均 小 于 其 他 部 位 。 当 然 这 与 样本 数 有 关 ， 但 也 不 排除 进化 的 因素 。 

本 工作 在 折 和 又 结构 的 层次 上 获得 了 一 维 序列 上 得 不 到 的 结果 。 折 又 结 构 告 诉 我 们 ， 在 
转录 过 程 中 作为 反 式 作用 因子 和 醇 的 结合 位 点 的 TATA 框 几乎 都 位 于 发 夹 环 、 内 环 或 游 
离 区 等 部 位 ， 而 环 区 、 内 环 和 游离 区 主要 起 反应 部 位 的 作用 ， 被 认为 对 跟 传 信息 的 表达 具 
有 功能 作用 ; 一 般 茎 区 起 稳定 折 和 又 结构 的 作用 ， 在 这 些 结构 的 芭 区 部 分 不 太 容 易 接 近 ， 其 
遗传 活性 也 败 于 单 链 帘 环 部 位 (Geisow 等 ，1983)。 本 文 在 折 释 结构 分 析 上 得 到 的 TATA 
框 的 信息 ， 对 于 进一步 研究 TATA 框 的 空间 结构 特征 和 分 子 进 化 可 能 有 较 大 的 帮助 。 


region of E. coli and eukaryotes 
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X1 基因 存 取 号 及 相应 的 TATA 框 的 折 和 又 结构 特征 
Table 1 Gene names and the character of the relevant TATA box's secondary structure 
Xx ESI 

存 取 号 位 置 草 链 区 Aat FRE 位 置 ARE pen 
X55765 1290—1296 H X00623 49—54 Z 
M60421 2300—2304 LI X14455 338—343 d 
X13257 473—478 LI M03022 105—112 Y 
X07367 1652—1657 LI X05587 785—791 Ni 
X05330 476—482 H D00340 506—512 i 
X04803 160—164 LI X15565 106—112 xx 
X51890 251—257 L 328—334 $k 
M37561 1204—1208 L X05258 306—309 
X00965 93—98 H X01843 551—555 LI 
X17262 336—342 y X00683 23—28 LI 
X17262 75—82 H X12769 5—11 Ji 
X17264 22—29 H X12768 15—24 J 
J02843 2762—2766 N X12767 91—98 J 
M25828 2150—21 58 of Y00513 515—521 H 
X06828 804—311 d X12772 386—391 J 
X17263 76—83 Y, X30606 652—656 L 
X02419 715—781 J X04523 379—382 J 
X12641 2326—2330 H X06639 136—142 H 
X07425 237—242 L M28997 116—122 L 
X02344 643—648 L X07249 44—50 RA 
M33494 197—201 LI X07251 6—13 y 
X05339 290 一 295 H M29004 206—211 L 
M33716 7 了 72 一 777 » M28403 330—337 y 
X04664 82—87 H X01749 406—413 J 
X02911 791—796 H X04384 105—110 i 
X02159 590—595 H X04488 372—376 L 
D00210 523—529 H D90154 708—713 H 
J04835 2249—2254 H X02570 286—291 H 
D00269 442—347 J X01746 173—179 x 
M29186 840—845 LI X16019 161—167 H 
M60556 2170—2176 LI X12365 26—33 H 
M05936 153—158 H X16018 1189—1195 H 
X07222 183—189 L X03704 6—9 J 
X07 192 186—192 L M32280 1089—1097 y 
X52508 669—675 L M32281 600—608 J 
X05929 1230—1237 H M05842 376—382 af 
M30461 236—241 H X05841 440—446 Y, 
M34224 122—129 H M22608 305—311 Jf 
X01780 264—269 M05618 27—36 Yi 
M33764 359—363 LI X02542 491—496 y 
X04502 242—247 Ri M34540 29—37 "i 
M03493 374—379 < M33156 2321—2326 LI 
Y00217 899—907 L J05161 290—294 Ll 
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HA 
AER HE X 
Tx 位 置 单 链 区 n ARE fi, 单 链 区 eb 
X01616 1033—1040 M60914 416—421 à 
X00635 158—167 H M57231 90—93 v 
X02801 217—219 L 128—132 Y 
Y 00500 580—585 H X04427 38—45 "; 
X03020 107—1111 H M22428 784—791 / 
M68896 891—895 L  X02989 13—19 LH 
M52914 41—45 H X15150 571—574 H 
X02645 401—407 H X52271 211—217 H 
Y00726 1166—1173 H X53906 592—596 H 
X00024 245—251 H M35498 790—794 H 
M26204 520—525 LI X13234 188—193 H 
X13235 194—201 LI X52830 496—500 H 
X13236 597—604 H X57409 1041—1053 LI 
M55218 492—497 L M59866 646—651 LI 
X16839 447—453 y M34645 1161—1166 H 
M64837 349—356 LY M34644 1907—1912 
M 58047 339—345 H M61011 888—892 u 
M 54876 1601—1606 LI 105517 1673—1676 
X13588 200—205 H X03753 1092— 1095 H 
M64542 344—349 / X02947 375—381 j 
M64844 2041—2045 y X02948 313—-379 M 
404971 781—786 L X02949 316—382 L 
M24263 454—458 H K02287 224—230 H 
X12617 910—914 y X36007 641—646 J 
X14422 213—217 L` M64852 482—487 L 
X12508 9—13 H X01023 1—6 / 
M24264 419—423 H 159—165 ba vy 
M27160 392—399 L M58046 67 一 73 H 


H， 发 夹 环 区 {hairpin regions Li: Ai (internal loop regionh L， 葵 环 结合 处 (the intersection 
of interloop and stem), 
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SECONDARY-STRUCTURAL FEATURES OF 
THE TATA BOX IN EUKARYOTIC 


LUO Hong! LIU Ci-quan? CAO Huai” 
UD Modern Biology Center. Yunnan Universery 650091) 
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the Chinese Academy af Sciences, Kunming 650223) 
Abstract 


The secondary-structural features of TATA box is important for the initial process of 
RNA transcription in eukaryotic. After observing the secondary-structures of 142 genes’ 
promotor sequences, we proposed this structural model of the stems and loops for the 
nucleotide sequences of the TATA box in eukaryotic. Our results suggested that the structur- 
al features of TATA box in structural models of the stems and loops were closely associate 
with the recognition and interaction of the transcription factor and RNA polymerase. We got 
a consistent result by comparing with the corresponded secondary-structural features of E. 
coli. Among the distribution of hairpin, interloop, and single strand there was a difference. 

Key words TATA box. Secondary structure 


